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【摘要 】 背景 随 着 人 口 老龄 化 及 寿命 延长 ， 慢 性 病 的 多 病 共存 日 益 普遍 。 疾 病 种 类 多 日 病 情 复杂 ， 为 老年 人 
建 康 管 理 提出 挑战 。 共 病 模式 作为 研究 的 必要 问题 ， 国 内 研究 相对 缺乏 。 目 的 ”研究 中 国 老年 人 常见 慢性 病 的 多 病 共 
存 模式 ,帮助 政策 制定 者 研究 人 员 和 临床 医生 更 好 地 了 解 多 病 共存 现状 。 方 法 ”选取 中 国 健康 养老 追踪 调查 ( CHARLS ) 
2018 年 数据 中 60 岁 及 以 上 被 访 者 ， 选择 人 口 特征 学 部 分 数据 及 健康 状况 的 14 种 慢 病 数据 。 采 用 关联 规则 、 聚 类 分 析 、 
主 成 分 分 析 、 洪 在 类 别 分 析 4 种 方法 对 中 国 老年 人 的 共 病 模式 进行 探索 ， 并 对 比 不 同方 法 所 得 结果 。 结 果 ”最 终 共 纳 
入 10 800 例 被 访 者 数据 。4 种 方法 所 得 模式 有 所 差异 ， 但 存在 一 致 性 的 共 病 模式 : (1 ) 高 血压 、 糖 尿 病 或 血糖 升 高 、 
血脂 异常 ; (2) 慢性 肺 部 疾患 和 哮 晒 ; (3 ) 关节 炎 或 风湿 病 、 胃 部 疾病 或 消化 系统 疾病 ; (4) 中 风 、 与 记忆 相关 
的 疾病 。 结 论 ”不 同方 法 得 到 的 一 致 模式 ， 所 包含 慢 病 病因 关系 关联 明显 ; 共 病 模式 存在 差异 的 原因 是 包含 的 病因 关 
系 复 杂 ， 且 方法 的 原理 不 同 。 
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[Abstract} Background With the aging and longer survival of the population, comorbid chronic diseases is 
increasingly common. The variety and complexity of diseases poses challenges to the health management of the elderly.There is a 
relative lack of multimorbidity pattern researches in China, whichare necessary issues for research. Objective To investigate 
the patterns of coexistence of common multiple chronic conditions among the elderly in China, in order to help policymakers, 
researchers, and clinicians better understand the current status of multimorbidity among Chinese elderly. Methods Data on 
the demographic characteristics and health status of 14 chronic diseases were extracted from the respondents aged 60 years and 
above in the China Health and Retirement Longitudinal Study ( CHARLS ) 2018, association rules, cluster analysis, principal 
component analysis, latent class analysis were used to explore the multimorbidity patterns of Chinese elderly, and the results 
of different methods were compared. Results The data from a total of 10 800 respondents were eventually included, there were 
differences among the patterns obtained by four methods.However, the consistent multimorbidity patterns were identified: (i) 
hypertension, diabetes or elevated blood glucose, dyslipidemia; (ii) chronic lung disease and asthma; (iii) arthritis or 
rheumatism, stomach diseases or digestive diseases; (iv) stroke, memory—related diseases. Conclusion The consistent 
patterns obtained by different methods contain chronic diseases with significant relationships of etiologies.The reasons of differences 
in results are complex etiologic relationships and different method principles. 
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WHO 对 于 多 病 共 存 ( multimorbidity ) 的 定义 为 : 
一 个 人 同时 患 有 两 种 或 多 种 疾病 … 。 城 镇 化 及 老龄 化 
使 老年 人 疾病 谱 发 生 了 显著 变化 ， 越 来 越 多 的 人 同时 患 
有 多 种 疾病 。 多 病 共存 涉及 疾病 的 病因 关系 多 样 ， 疾 病 
类 型 没有 限定 ， 并 不 明确 哪 一 种 疾病 为 索引 疾病 "1 。 
国内 外 多 病 共存 模式 研究 常用 的 方法 有 : 多 病 个 数 统计 
631 、 聚 类 分 析 '* 、 因 子 分 析 ' 引 及 相关 分 析 “! 。 研 究 
数据 来 源 为 : 调查 数据 、 临 床 数 据 或 医疗 数据 ， 涉 及 疾 
病 有 些 是 常见 疾病 ， 有 些 是 罕见 疾病 。 孙 志 佳 等 选 
取 2 次 中 国 慢 病 前 瞻 性 研究 数据 ， 采 用 个 数 统计 及 系统 
聚 类 对 10 个 地 区 被 访 者 的 共 病 模式 进行 分 析 ; 刘 贝 贝 
等 选取 CHARLS 数据 采用 关联 规则 探索 常见 慢性 疾 
病 的 共 病 组 合 模式 ; OLAYA 等 "1 采用 潜在 类 别 分 析 区 
分 “Edad con Salud” 调 查 被 访 者 共 病 模式 并 进行 预后 分 
析 ， 涉 及 疾病 包含 常见 慢 病 及 和 白内障。 既往 研究 选取 数 
据 、 疾 病 及 使 用 方法 不 同 ， 得 到 的 共存 模式 研究 结果 各 
异 ， 可 信 度 较 低 ， 很 少 有 对 同一 数据 采取 多 种 方法 ， 并 
对 比 结果 来 确保 研究 成 果 的 可 靠 性 。 

本 研究 旨 在 采用 多 种 方法 探索 中 国 老 年 人 常见 慢 病 
的 多 病 共 存 模式 ， 并 分 析 不 同方 法 所 得 结果 的 差异 性 与 
一 致 性 。 选 取 中 国 健 康 与 养老 追踪 调查 〈 China Health 
and Retirement Longitudinal Study，CHARLS ) 2018 年 的 
数据 ， 应 用 4 种 方法 探索 多 病 模式 ， 避 免 了 不 同 数据 导 
致 结果 无 法 比较 的 问题 ， 通 过 比较 不 同方 法 所 得 结果 的 
一 致 性 ， 从 而 得 出 稳定 的 多 病 模 式 。 

1 资料 与 方法 

1.1 数据 来 源 CHARLS 旨 在 收集 代表 中 国 45 岁 及 以 
上 中 老年 人 家 庭 和 个 人 的 高 质量 微观 数据 ， 用 以 分 析 我 
国人 口 老龄 化 问题 ,推动 老龄 化 问题 的 跨 学 科研 究 "1。 
选择 经 过 数据 清洗 的 Harmonized_CHARLS_D 版 本 ， 从 
中 筛选 2018 年 的 数据 进行 分 析 ， 选 取 人 口 特征 学 部 分 
数据 及 健康 状况 的 14 种 慢 病 数据 。 

1.2 ”数据 处 理 ” 由 于 Harmonized_CHARLS_D 版 本 经 过 
数据 清洗 ， 质 量 较 高 。 为 了 保证 研究 数据 与 总 体 的 一 致 
性 , 仅 筛选 年 龄 60 岁 及 以 上 的 被 访 者 , 不 删除 缺失 值 ， 

最 终 得 到 10 800 份 被 访 者 数据 。14 种 慢 病 数据 的 缺失 
值 较 少 ， 通 过 众 数 填补 。 人 口 特征 学 数据 未 参与 模式 分 
析 故 不 做 处 理 ， 在 描述 时 以 缺失 值 展 示 。 

1.3 ”数据 定义 方法 “CHARLS 数据 选取 的 14 种 慢 病 为 : 
高 血压 ， 糖 尿 病 或 血糖 升 高 ( 包括 糖 耐 量 异 常 和 空腹 血 
糖 升 高 ) ， 癌 症 等 恶性 肿瘤 (不 包括 轻 度 皮肤 癌 ) ， 慢 
性 肺 部 疾患 如 慢性 支气管 炎 或 肺 气 有 种 、 肺 心病 (不 包括 
肿瘤 或 癌 , 后 简称 慢性 肺 部 疾患 ), 心脏 病 ( 如 心肌 梗死 、 
冠 心病 、 心 绞 痛 、 充 血性 心力 衰竭 和 其 他 心脏 疾病 ) ， 

中 风 ， 情 感 及 精神 方面 问题 ， 关 节 炎 或 风湿 病 ， 血 脂 异 
常 〈 高 血脂 或 低 血 脂 ) ， 肝 脏 疾 病 ( 除 脂肪 肝 、 肿 瘤 或 


ChinaXiv 合 作 期 刊 
中 国 全 科 医 学 杂志 


癌 外 ) ， 肾 脏 疾病 (不 包括 肿瘤 或 癌 ) ， 胃 部 疾病 或 消 
化 系统 疾病 (不 包括 肿瘤 或 癌 ) ， 哮 跨 ， 与 记忆 相关 的 
疾病 ( 如 老年 痴呆 症 、 脑 萎缩 、 帕 金森 症 ) 。 

人 口 特征 学 数据 包括 : 性 别 ( 男 、 女 ) ， 年龄， 家 
庭 居住 地 类 型 ( 城市、 农村 ) ， 被 访 者 户口 类 型 (城市 
户口 、 农 村 户口 ) ， 受 教育 程度 (小 学 以 下 、 小 学 及 初 
中 学 历 、 高 中 及 职业 培训 、 大 专 及 以 上 ) 及 婚姻 状况 (已 
婚 、 分 居 或 离婚 、 丧 偶 、 未 婚 ) 。 

1.4 ”研究 方法 ”数据 处 理 及 所 用 方法 通过 R 语言 编程 
实现 ,运用 多 个 R 语 言 包 完成 4 种 分 析 。 数 据 的 一 般 
情况 包含 被 访 者 人 群 的 概况 统计 ，14 种 慢 病 的 发 病 率 、 
共 病 率 、 平 均 共 病 个 数 及 方差 .以 此 了 解 被 访 者 人 群 的 
特征 及 14 种 慢 病 的 发 病情 况 。 

1.4.1 关联 规则 采用 关联 规则 发 现 常 见 两 病 及 三 病 组 
合 ， 支 持 度 为 疾病 组 合 的 观察 发 病 率 ， 提 升 度 为 独立 性 
判断 指标 ， 在 两 病 组 合 中 与 观察 发 病 率 /期 望 发 病 率 相 
同 。 设 置 关联 规则 前 项 集 与 后 项 集 的 个 数 、 支 持 度 最 小 
值 可 以 得 到 观察 发 病 率 较 高 的 组 合 。 计 算 组 合 预期 发 病 
率 并 结合 提升 度 ， 判 断 疾 病 的 独立 性 。 

1.4.2” 聚 类 分 析 “ 聚 类 分 析 根 据 某 些 数 量 特征 将 观察 对 
象 分 类 ， 根 据 聚 类 对 象 的 不 同 ， 可 以 分 为 个 案 聚 类 和 变 
量 聚 类 。 反 映 个 案 或 者 变量 间 性 质 远 近 的 统计 量 称 为 距 
离 ， 有 多 种 计算 方法 。 将 被 访 者 的 14 种 慢 病 数据 处 理 
为 01 形式 ， 即 被 访 者 患 有 此 疾病 时 为 1， 未 患 有 此 疾 
病 时 为 0。 处理 完成 的 14 种 慢 病 数据 可 以 看 成 一 个 n*p 
的 01 矩阵， 其 中 是 被 访 者 的 个 数 (10 800 ) ，p 为 慢 
病 种 数 14。 被 访 者 的 聚 类 是 个 案 聚 类 ， 依 据 14 种 慢 病 
的 发 病情 况 计算 得 到 的 nsn 距离 矩阵 进行 分 类 。 对 14 
种 慢 病 的 系统 聚 类 通过 慢 病 在 被 访 者 中 的 共 现 情况 ， 得 
到 一 个 psp 距离 矩阵 并 由 此 分 类 。 本 研究 对 被 访 者 采用 
k-medoids 算法 ,对 14 种 慢 病 采 用 系统 聚 类 以 区 分 多 病 
共存 模式 。 

01 数据 距离 的 选择 取决 于 正 匹 配 ( 同 为 1) 和 负 
匹配 ( 同 为 0) 的 相对 权重 ,而 相对 权重 又 取决 于 正 匹 
配 和 负 匹 配 的 相对 重要 性 。 本 研究 采用 01 数据 常用 的 
Jaccard 距离 和 Yule's 0Q 距离 ，Yule's 0Q 是 一 种 能 体现 两 
种 慢 病 负 匹配 及 未 匹配 时 信息 的 相似 度 计算 方法 ， 较 
好 地 反映 01 数据 所 有 相关 信息 '“”  ，Jaccard 距离 仅 突 
出 正 匹配 ” 。 共 病 模式 中 侧重 于 慢 病 正 匹配 ， 即 共同 
发 病 ， 并 且 被 访 者 中 存在 健康 者 (全 0 数据 ) ，Yule's 
Q 在 1 个 数据 为 全 0 时 无 法 计算 。 对 比 两 个 距离 计算 方 
法 的 效果 ， 并 考虑 其 临床 意义 后 ， 最 终 采 用 Yule's Q 距 
离 进行 慢 病 的 系统 聚 类 分 析 ; 采用 Jaccard 距离 进行 被 
访 者 的 k-medoids 聚 类 。 系 统 聚 类 的 分 类 个 数 通过 谱系 
图 结合 临床 意义 确定 ， 聚 类 方法 为 类 平均 法 ; 被 访 者 的 
k-medoids 聚 类 个 数 通过 factoextra 包 中 的 fwiz_nbclust 辑 
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数 确定 。 

1.4.3” 主 成 分 分 析 ”每 个 变量 在 不 同 程度 上 反映 了 某 些 
信息 并 存在 有 一 定 的 相关 性 。 变 量 太 多 会 增加 计算 量 及 
分 析 问 题 的 复杂 性 ， 主 成 分 分 析 通 过 恰当 的 数学 变换 ， 
使 新 变量 为 原 变量 的 线性 组 合 ， 并 选取 少数 几 个 在 变 差 
总 信息 量 中 比例 较 大 的 主 成 分 来 分 析 事 物 。 本 研究 采用 
最 大 方差 旋转 的 主 成 分 分 析 方 法 ， 使 用 方差 贡献 度 确定 
主 成 分 个 数 并 将 14 个 多 病 化 简 为 少数 疾病 组 合 ， 以 载 
荷 系 数 绝对 值 >0.36 选择 主 成 分 包含 的 慢 病 。 

1.4.4 潜在 类 别 分 析 (latent class analysis, LCA ) 
LCA 根据 被 访 者 在 14 种 慢 病 的 患 病 情况 对 其 分 类 。 与 
聚 类 分 析 类 似 ，LCA 通过 个 体 间 相似 性 区 分 类 别 ， 但 不 
定义 类 别 之 间 的 距离 ， 也 不 选择 分 类 方法 ,根据 个 体 所 
有 变量 的 观测 变量 概率 进行 分 类 。 遍 历 所 有 的 分 类 ， 比 
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较 指 标 得 到 最 优 分 类 个 数 。 常 用 于 判别 最 优 模型 的 指标 
是 : Likelihood-ratio，G2 statistic ， Bayesian Information 
Criterion ( BIC ) 等 ， 采 用 R 语言 的 poLCA 包 进 行 LCA 
分 析 ， 最终 类 别 判定 指标 为 BIC 值 。 
2 结果 
2.1 被 访 者 人 群 特征 ”最 终 得 到 10 800 例 60 岁 及 以 上 
的 被 访 者 ， 被 访 者 中 女性 稍 多 (51.3% ) ， 居 住 在 农村 
的 被 访 者 较 多 ( 60.3% ) , 农村 户口 被 访 者 较 高 (74.0% )。 
被 访 者 受 教育 程度 普遍 较 低 ，90.7% 的 被 访 者 未 接受 高 
中 及 以 上 教育 ， 由 于 CHARLS 访谈 以 家 庭 为 单位 进行 ， 
已 婚 被 访 者 较 多 (77.9% ) ， 这 与 国内 人 口 总 体 特征 一 
致 “  。86.2% 的 被 访 者 患 有 1 种 及 以 上 的 慢 病 ，49.0% 
的 被 访 者 患 有 2~4 种 慢 病 ( 表 1) 。 

14 种 慢 病 共 病 率 均 高 于 85% ( 表 2 ) ， 发 病 率 最 高 


表 1 研究 对 象 的 慢 病 种 数 及 基本 特征 


Table 1 Numpber and basic characteristics of chronic diseases of research subjects 
2018 年 龄 家 庭 居住 地 类 型 
组 别 。 例 数 。 多 病 种 数 无 慢 病 。” ”1 种 慢 病 ” ”2 种 慢 病 3 种 慢 病 4 种 慢 病 年 上 年 龄 城市 农村 
(x+5, 岁 ) [M(P;s, Ps), 岁 ] 
性 别 
男 5261 826(15.7) 1181(224) 1082(20.6) 868 (16.5) 564(107) 740(141) 69.1+7.0 68.0 ( 60.0，118.0 ) 2056(39.1) 3205(60.9) 
女 5539 660 (119) 1077(19.4) 1164(21.0) 960(17.3) 660(119) 1018 (18.4) 69.2+7.2 68.0 ( 60.0，108.0 ) 2234( 40.3 ) 3305(59.7) 
总 体 10800 1486(13.8) 2258(20.9) 2246(20.8) 1828(16.9) 1224(113) 1758 (163) 692+72 68.0 ( 60.0，118.0 ) 4290(39.7) 6510(60.3 ) 
组 被 访 者 户口 类 型 受 教育 程度 婚姻 状况 
城市 户 农村 户口 缺失 值 。 ”小 学 以 下 、 小 学 及 初中 高 中 及 职业 培训 。 大 专 及 以 上 已 婚 分 居 或 离婚 丧偶 未 婚 
性 别 
男 1401(26.6) 3755(71.4) 105 (2.0) 4565 (86.8 ) 578 ( 11.0 ) 118(22) 4530(86.1) 73(14) 592(11.3) 66 (1.3 ) 
女 1179(21.3) 4234(76.4) 126 (2.3) 5234 ( 94.5 ) 263 (4.7) 42(0.8) 3883(70.1) 54(10) 1597(28.8) 5 (0.1) 
总 体 2580(23.9) 7989(740) 231(2.1) 9799 (90.7) 841 (7.8) 160(15) 8413(77.9) 127(12) 2189(203) 71(07) 


的 是 高 血压 (47.14% ) ,平均 共 病 个 数 较 多 的 是 情感 及 
精神 方面 问题 (4.16 ) 及 与 记忆 相关 的 疾病 (4.17 )。 中风 、 
肝脏 疾病 及 肾脏 疾病 的 发 病 率 较 低 ， 但 平均 共 病 个 数 较 
高 。 
2.2 关联 规则 分 析 表 3 展示 了 支持 度 >10% 的 所 有 两 
病 组 合 ， 表 4 展示 了 支持 度 >5% 的 三 病 组 合 。 仅 从 支 
持 度 考 虑 ， 关 联 规则 得 到 的 共 病 组 合 仅 是 共同 发 生 ， 例 
如 : 关节 炎 或 风湿 病 与 高 血压 在 老年 人 群 中 共同 发 病 率 
较 高 ， 但 病因 相对 独立 ， 故 观察 发 病 率 /期望 发 病 率 接 
近 于 1。 血 脂 异 常 与 心脏 病 共 同 发 病 率 高 ， 结 合 观察 发 
病 率 与 期 望 发 病 率 的 发 现 关 联 ， 两 者 病因 有 关 。 

三 病 组 合 选取 观察 发 病 率 与 期 望 发 病 率 的 比值 及 提 
升 度 来 判断 疾病 间 的 联系 。 一 : 心脏 病 ， 血 脂 异 常 及 高 
血压 病 ; 二 : 糖尿 病 或 血糖 升 高 , 血脂 异常 及 高 血压 病 ; 
两 个 病 组 的 观察 发 病 率 /期望 发 病 率 高 ， 提 升 度 较 高 ， 
在 病因 学 关系 及 致 病因 素 上 存在 关联 。 


表 2 慢 病 发 病 率 及 共 病 率 


Table 2 Incidence and co-morbidity of chronic diseases 


慢 病 发 病人 数 共 病人 数 平均 共 病 种 数 

( 例 ) ( 例 ) (x+s) 

高 血压 5091 (47.14) 4458 (87.57) 2.56+ 1.92 
糖尿 病 或 血糖 升 高 1656 (15.33) 1578 (95.29) 3.41 +2.06 
高 症 等 恶性 肿瘤 279 (2.58) 249 ( 89.25 ) 3.09 +2.44 
慢性 肺 部 疾患 2121 (19.64) 1983 (93.49 ) 3.34+2.09 
心脏 病 2684 (24.85) 2580 (96.13) 3.46+ 1.98 

中 风 1093 (10.12) 1047 (95.79) 3.51 +2.07 

情感 及 精神 方面 问题 398 (3.69) 377 ( 94.72 ) 4.16+2.56 
关节 炎 或 风湿 病 4808 (44.52) 4159 (86.50 ) 2.53+1.96 
脂 异 党 2644 (2448) 2531 (95.73 ) 3.37+1.97 

F 脏 疾病 779 (7.21) 745 ( 95.64 ) 3.87 + 2.29 

肾脏 疾病 1245 (11.53) 1200 (96.39) 3.84+2.21 

胃 部 疾病 或 消化 系统 疾病 。 3403 (31.51) ”3069 (90.19) 2.85 + 2.02 
哮喘 855 (7.92 ) 845 ( 98.83 ) 4.04+2.15 

与 记忆 相关 的 疾病 656 (6.07) 633 ( 96.49 ) 4.17+2.35 
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表 3 两 病 的 关联 规则 分 析 及 卡 方 检验 


Table 3 Analysis of association rules and chi-sdquare test for two chronic diseases 


关节 炎 或 风湿 病 高 血压 2 428 22.48 20.99 39.03 <0.001 1.07 
胃 部 疾病 或 消化 系统 疾病 ” 关节 炎 或 风湿 病 2 056 19.04 14.03 507.53 <0.001 1.36 
脂 异 常 高 血压 1 812 16.78 11.54 641.94 <0.001 1.45 
心脏 病 高 血压 1 752 16.22 11:71 470.52 <0.001 138 
部 疾病 或 消化 系统 疾病 ” 高 血压 1 613 14.94 14.85 0.12 0.729 1.01 
心脏 病 关节 炎 或 风湿 病 1 428 13:22 11.06 108.62 <0.001 1.20 
脂 异 常 关节 炎 或 风湿 病 1 320 12.22 10.90 41.13 <0.001 1.12 
慢性 肺 部 疾患 关节 炎 或 风湿 病 1 204 11.15 8.74 159.66 <0.001 1.28 
心脏 病 骨 部 疾病 或 消化 系统 疾病 1 179 10.92 7.83 254.43 <0.001 1.39 
脂 异 常 心脏 病 1 168 10.81 6.08 698.65 <0.001 1.78 
糖尿 病 或 血糖 升 高 高 血压 1 144 10.59 A 376.91 <0.001 1.47 
慢性 肺 部 疾患 高 血压 1 103 10.21 9.26 24.83 <0.001 1.10 


表 4 三 病 组 合 的 关联 规则 分 析 


Table 4 Analysis of association rulesfor triple disease combinations 


关节 炎 或 风湿 病 ， 胃 部 疾病 或 消化 系统 疾病 ”高 血压 1011 9.40 6.60 1.42 1.42 

心脏 病 ， 关 节 炎 或 风湿 病 高 血压 940 8.70 5.20 1.67 1.67 

关节 炎 或 风湿 病 ， 血 脂 异 党 高 血压 914 8.50 5.10 1.67 1.65 

心脏 病 ， 血 脂 异 常 高 血压 895 8.30 2.90 2.86 2.89 

心脏 病 ， 胃 部 疾病 或 消化 系统 疾病 关节 炎 或 风湿 病 798 7.40 3.50 2.11 2.12 

心脏 病 ， 胃 部 疾病 或 消化 系统 疾病 高 血压 734 6.80 3.70 1.84 1.84 

糖尿 病 或 血糖 升 高 ， 血 脂 异 常 高 血压 692 6.40 1.80 3.56 3.62 
脂 异 常 ， 胃 部 疾病 或 消化 系统 疾病 高 血压 677 6.30 3.60 1.75 1.72 

慢性 肺 部 疾患 高 血压 670 6.20 4.10 1.51 1.51 

慢性 肺 部 疾患 关节 炎 或 风湿 病 665 6.20 2.80 221 2.24 

心脏 病 ， 血 脂 异 常 关节 炎 或 风湿 病 653 6.00 2.70 2.22 2.23 

血脂 异常 ， 胃 部 疾病 或 消化 系统 疾病 关节 炎 或 风湿 病 648 6.00 3.40 1.76 1.75 
朝 尿 病 或 血糖 升 高 ， 关 节 炎 或 风湿 病 高 血压 566 5.20 3.20 1.63 1.63 

心脏 病 ， 血 脂 异 常 胃 部 疾病 或 消化 系统 疾病 547 5.10 1.90 2.68 2.64 

2.3” 聚 类 分 析 通过 分 析 14 种 常见 慢 病 的 谱系 图 ( 图 i 

1 ) ， 通 过 距离 接近 程度 将 慢 病 分 为 6 类 ， 以 不 同 颜色 Rare 

区 分 。Yule'Q 距离 体现 了 慢 病 在 人 员 中 的 发 病 信息 ， 距 [ee 

离 较 近 慢 病 即 在 被 访 者 中 共同 发 病 率 较 高 ， 发 病因 素 多 0 

有 所 关联 ， 如 哮 哗 与 慢性 肺 部 疾患 同 为 呼吸 系统 疾病 ， 一 一 慢性 肺 部 疾患 如 慢性 支气管 炎 或 肺 气 肿 、 肺 心病 

血脂 异常 、 糖 尿 病 或 血糖 升 高 、 中 风 与 高 血压 同 为 血管 < 

循环 系统 疾病 ， 与 记忆 相关 的 疾病 、 情 感 及 精神 方面 问 一 一 一 一 一 一 中 风 

题 为 精神 心理 疾病 ， 胃 部 疾病 或 消化 系统 疾病 与 关节 炎 se 

或 风湿 病 同 为 代谢 系统 疾病 。 心 脏 病 与 与 记忆 相关 的 疾 | 粮 尿 病 或 血糖 升 高 

病 、 人 情感 及 精神 方面 问题 为 精神 心理 疾病 距离 接近 ， 三 


ee 到 二 图 1 14 种 慢 病 的 系统 聚 类 谱系 图 
者 可 以 聚 为 一 类 ， 癌症 等 恶性 肿瘤 独立 于 其 他 疾病 ， 单 Figure 1 Dendrogram of systematic clustering of 14 chronic diseases 


独 为 一 类 。 
被 访 者 的 聚 类 使 用 簇 内 平方 误差 和 确定 最 佳 的 簇 数 。 ”的 患 病 情况 及 疾病 个 数 统计 如 表 5。 由 于 k-medoids 聚 
为 4 个 ， 聚 类 后 每 个 被 访 者 有 1 个 分 类 ， 对 4 个 分 类 ”类 选取 Jaccard 距离 ， 侧 重 于 体现 同时 发 病 信息 。 分 类 
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1 包含 了 所 有 的 无 慢 病 及 患 有 1~2 种 共 病 率 较 低 的 慢 病 
的 被 访 者 ， 相 对 健康 。 分 类 2 呼吸 系统 疾病 、 胃 部 疾病 
或 消化 系统 疾病 的 发 病 率 远 高 于 总 体 ， 关 广 炎 或 风湿 病 
发 病 率 略 高 于 总 体 ， 系 统 聚 类 中 呼吸 系统 疾病 为 一 类 

与 其 他 疾病 相对 独立 。 胃 部 疾病 或 消化 系统 疾病 、 关 节 
炎 或 风湿 病 发 病 也 独立 于 其 他 疾病 ， 这 4 种 慢 病 组 合 随 
机 共存 的 患者 多 在 分 类 2 中 。 分 类 3 中 3~5 种 共 病 被 访 
者 占 比较 高 ， 其 中 心脏 病 、 血 脂 异 常 的 发 病 率 远 高 于 总 
体 ， 而 高 血压 、 中 风 等 疾病 的 发 病 率 略 高 于 总 体 。 常 见 
的 3~5 种 共 病 多 为 心血 管 疾病 〈 高 血压 、 糖 尿 病 或 血糖 


升 高、 血脂 异常 、 心 脏 病 ) ， 可 以 推测 分 类 3 为 包含 这 
几 个 疾病 的 共 病 组 合 。 分 类 4 中 被 访 者 均 患 有 高 血压 ， 


但 是 平均 共 病 个 数 为 1.82 个 ， 并 且 除 高 血压 之 外 的 慢 
病 发 病 率 均 低 于 总 体 ， 可 以 推测 分 类 4 包含 仅 串 有 高 血 
压 的 被 访 者 及 高 血压 与 非 心血 管 疾病 组 合 的 患者 。 


2.4 通过 主 成 分 对 被 访 者 进行 k-medoids 聚 类 分 析 通 
过 雄 石 图 ( 图 2 ) 确定 主 成 分 个 数 为 5 个 ， 设 定 载荷 系 


数 >0.36 得 到 各 主 成 分 不 重 闪 的 代表 慢 病 ， 同 一 主 成 分 
的 代表 疾病 关联 性 较 强 。 第 一 主 成 分 包含 高 血压 ， 糖 尿 
病 或 血糖 升 高 ， 心 脏 病 ， 血 脂 异 常 ; 第 二 主 成 分 包含 慢 
性 肺 部 疾患 与 哮喘 ， 第 三 主 成 分 包含 关节 炎 或 风湿 病 ， 
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Figure 2 Scree plot for factor analysis 


癌症 等 恶性 肿瘤 ， 肝 脏 疾 病 ， 肾 脏 疾 病 。 

2.5 ”潜在 类 别 分 析 通过 最 小 的 BIC 指标 确定 最 优 的 
分 类 个 数 为 5 个 ,分 析 潜 在 类 别 的 条 件 概 率 分 布 图 ( 图 3 ) 
及 各 类 别 与 慢 病 及 慢 病 个 数 的 交叉 表 ( 表 7) 。 分 类 5 
是 为 相对 健康 组 ,包含 了 所 有 的 无 慢 炳 及 只 有 1 个 慢 病 
的 被 访 者 ， 大 部 分 两 病 的 被 访 者 ，14 个 慢 病 的 发 病 率 
均 低 于 总 体 。 分 类 1 为 代谢 系统 疾病 组 ， 关 节 炎 或 风湿 
病 、 胃 部 疾病 或 消化 系统 疾病 的 发 病 率 高 ; 分 类 2 为 血 
管 循环 疾病 (高 血压 病 、 糖 尿 病 或 血糖 升 高 、 心 脏 病 、 


胃 部 疾病 或 消化 系统 疾病 ; 第 四 主 成 分 包含 中 风 ， 情 感 。 血脂 异常 ) 组 合 ; 分 类 3 为 多 病 组 ， 有 5 个 以 上 的 慢 病 ， 
及 精神 方面 问题 ， 与 记忆 相关 的 疾病 ; 第 五 主 成 分 包含 。” 人 数 较 少 ， 多 个 慢 病 的 发 病 率 高 于 总 体 ;分 类 4 为 呼吸 
表 5 多 病 被 访 者 的 k-medoids 聚 类 分 析 结 果 ( 分 组 被 访 者 的 发 病 率 ) 

Table 5 Results ofk-medoids clustering analysis of respondentswith multimorbidity 
鳞 。 钱 (全 1 和 

[ 例 (%) ] [ 例 (%) [ 例 (%)】  [ 例 (%) 

分 类 1 3259 505 (1550) 57 (1.75) 73 (2.24 0 75 (230) 154 (4.73) 62 (1.90) 1532(47.00 87 {267 
分 类 2 。 2016 264 (13.10) 46 (2.28) 47(233) 1161(5760) 222(1101) 104 (5.16) 77(3.82) 1139 (56.5 92 (4.56 
分 类 3 3861 2656 (68.80) 1425(3690) 124 (321 803 (20.80) 2197(56.82) 664(1720) 232(601) 2135(55.30) 2259(58.50 
分 类 4 1664 1664(100.00) 128 (7.69) 35 (2.10 156 (938) 191 (11.48) 170 (10.22) 27 (1.62) 0 206 (12.38 
总 体 10800 5091 (47.14) 1656(1533) 279(2.58) 2121(19.64) 2684(24.85) 1093(1012) 398(3.69) 4808(44.52) 2644(24.48 

家 及 疾病 睛 脏 疾病。 导 部 疾病 或 | 记 : 慢 1 种 慢 病 ”2 种 慢 病 。 ”3 种 慢 病 。 ”4 种 慢 病 
人 ([ 例 (%)]。[ 例 (%) 0 [人 ) 人 中] (的 [全 (9 ( 宰 (9】[ 鲍 ( 
分 类 1 99 (304) 178 (5.46) 0 44 (135) 80 (2.45) 1486(45.60) 858(26.33) 688(21.11) 195 (5.98) 32 (0.98) 
分 类 2 172 (853) 242(12.00) 1407(69.80) 333 (165) 81 (4.02) 0 472 (23.41) 582(28.87) 443(21.97) 261 (12.95) 
分 类 3 440 (11.40) 741 (19.20) 1819(47.10) 425 (11.00) 432 (11.20) 0 295 (7.64) 261 (676) 890(2305) 915 (23.7) 
分 类 4 6 (397) 86 (5.17) 180(1082) 5 (331) 63 (3.79) 0 633 (38.04) 715(42.97) 300(18.03) 16 (0.96) 
总 体 779 (721) 1245(11.53) 3403(3151) 855 (792) 656 (6.07) 1486(13.76) 2258(2091) 2246(2096) 1828(16.93) 1224(11.33) 
全 (守护 】 (全 的 ) 全 人) (全 ( 瓜 ) (全 ( 允 (全 (的 和 (全 (的 (向 (9 (全 (% 平和 数 (xs) 
分 类 1 0 0 0 0 0 0 0 0 0 0.90 +0.99 
分 类 2 194 (962) 50 (248) 10(0.50) 1 (0.05) 2 (0.10) 0 1 (0.05) 0 0 2.67+1.42 
分 类 3 617(15.98) 426(11.03) 247(640) 117(3.03) 56(145) 22(0.57) 8 (021) 4 (0.10) 3 (0.08) 4.24 +1.90 
分 类 4 0 0 0 0 0 0 0 0 0 1.82 + 0.75 
总 体 811 (751) 476 (441) 257(2.38) 118(1.09) 58(054) 22(0.20) 9 (0.08) 4 (0.04) (0.03) 2.57+1.99 
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a ee Wm 本 研究 特 指 “Multimorbidity”, 为 “ 同 
ee ee a 本 研究 得 到 的 有 一 致 性 
糖尿 病 或 血糖 升 高 es 的 几 种 共 病 模式 是 : (i) 高 血压 、 糖 尿 病 或 血糖 升 高 
心脏 病 pd 血脂 异常 ; (ii) 慢性 肺 部 疾患 、 哮 喘 ; 《让 ) 关节 炎 
1 脂 异 常 0.69 或 风湿 病 、 胃 部 疾病 或 消化 系统 疾病 ; (iv) 中 风 、 与 
分 类 2 关节 炎 或 风湿 病 0.68 记忆 相关 的 疾病 。 不 同方 法 得 到 组 合 有 所 差异 ， 例 如 心 
胃 部 疾病 或 消化 系统 疾病 0.72 脏 病 在 主 成 分 分 析 及 潜在 类 别 分 析 中 与 模式 i 关系 紧密 ， 
分 类 3 慢性 肺 部 疾患 0.82 但 在 系统 聚 类 中 关联 较 远 。 恶 性 肿瘤 在 多 个 方法 中 均 独 
哮喘 0.85 立 于 其 他 疾病 ， 情 感 及 精神 方面 问题 发 病 率 较 低 ， 这 两 
分 类 4 中 风 049 者 在 某 些 方法 中 与 其 他 疾病 有 一 些 关联 ， 但 是 没有 明显 
ea 7 及 稳定 的 共 病 组 合 。 肾 脏 疾 病 、 肝 脏 疾病 虽然 多 种 分 类 
es "中 有 所 体现 ， 但 丙 首 的 病因 学 关系 相对 独立 。 
有 a 不 同方 法 的 原理 不 同 。 关 联 规则 通过 控制 前 项 集 及 
攻 莽 三 语 本 后 项 集 的 个 数 ， 得 到 指定 数量 的 疾病 组 合 ， 提 升 度 判断 
独立 性 以 区 分 共存 类 型 ， 但 是 支持 度 仅 体现 共 病 观察 发 
系统 疾病 组 ， 呼 吸 系统 疾病 〈 慢性 肺 部 疾患 如 慢性 支 气 。 病 率 。 系 统 聚 类 及 主 成 分 分 析 ， 侧重 于 慢 病 共 现 的 关 
管 炎 或 肺 气 肿 、 肺 心病 、 哮 喘 ) 的 患 病 率 较 高 。 联 性 ， 结 果 能 较为 清晰 的 体现 病因 关联 ，k-medoids 及 
3 讨论 LCA 侧重 于 通过 人 和 群 反 映 共 病 组 合 ， 两 者 的 目的 均 是 将 
3.1 不 同 研究 方法 所 得 共 病 模式 的 差异 及 一 致 性 共 个体 分 类 。k-medoids 聚 类 基于 距离 按 空间 位 置 进 行 分 
表 7 潜在 类 别 分 析 分 类 与 慢 病 交 叉 表 
Table 7 Cross table of latent classes with chronic diseases 
鳞 全 (全 (的 of。 于 [OOO OA CO 
[ 例 (%) ]  【 例 (%) ] [ 例 (%) ]  【 例 (%) ] 
classl 1266 501(39.6 8 (65) 42(33) 409 (323) 400(316) 9 (4) 74 (58) 1111(878) 21(175) 
class? 2728 2389 (87.6 090 (40) 73(27) 75 (101) 1287(472) 694(254) 77 (28) 1059(388) 1623 (595) 
olass3 559 446(798) 240(429) -32(57) 361 (646) 497(889) 16(292) 139(249) 445(796) 437(782) 
olass4 617 304(492 63(102) 12(19) 589(953) 259(419) 33 (53) 2 (36) 335(542) 111(1800) 
class5 5629 141(258) 181 (32) 120(21) 487 (87) 24 (43) 109 (19) 86 (15) 1858(3300) 252 (45) 
总 体 10800 5091 (472) 1656(1533) 279(258) 2121(19.64) 2684(2485) 1093(1012) 398 (369) 4808(4452) 2644 (2448) 
下 有 吧 及 此 详 胃 部 疾病 或 i pe 和 ee 记 二 
和 (向 (5 (全 (% (9 | ( 生 (的 (全 (  ( 抽 ( 鸭 ) ( 负 (4 
casl 288(227) 346(273) 1182(934) 2 (23) 71 (56) 0 0 9 (071) 561(4431) 402 (3175) 
class2 133 (49) 284(104) 575(211) 49 (18) 270 (99) 0 0 525(1924) 896 (3284) 650 (23.83) 
class3 204(365) 328(587) 429(767) 199(356) 198 (354) 0 0 0 0 0 
class4 30 (49) 60 (97) 212(343) 546(883) 35 (57) 0 0 51 (827) 150(2431) 169 (2739) 
class5 14 (22) 27(400) 1005(179) 32 (06) 15) 1486(264) 2258 (4011) 1661(2951) 221 (393) 3 (005) 
总 体 779 (721) 1245 (11.53) 3403(3151) 855(792) 656 (607) 1486(1376) 2258(2091) 2246(208) 1828(1693) 1224(1133) 
人 类。 [出 (多 [全 (】 [全 (多 】 [全 (的 ] (和 (%) (后 (% (后 (%)) [ 售 C%) ) 。( 伴 ( 间 ) ) 平和 (xs 
casl 224(1769) 的 (545) 1(008) 0 0 0 0 0 0 3.83+092 
cas2 437 (1602) 186 (682) 33 (12) 1 (00M) 0 0 0 0 0 3.62+1.23 
cas3 18 (322) 132(2361) 196(3506) 117(2093) 58(1038) 22(394) 9(16) 4(07) 3(054) 737+136 
olas4 132(2139) 89(1442) 27 (438) 0 0 0 0 0 0 422+131 
oas5 0 0 0 0 0 0 0 0 0 1L11+084 
总 体 。 81 (751) 46 (441) 257 (238) 18 (1.09) 58 (054) 2(020) 9(008) 4(004) 3(003) 2.57+199 
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图 3 5 个 分 类 潜在 类 别 的 条 件 概率 分 布 图 


Figure 3 ”Probability distribution graph of five latent classes 


类 ， 分 类 结果 与 所 选 距离 算法 有 关 ; LCA 相对 客观 ， 是 
注重 于 个 体 在 类 别 显 变量 上 的 不 同 反 应 模式 对 个 体 进 行 
分 类 、 识 别 群体 异 质 性 的 一 种 统计 方法 。 两 种 方法 
通过 人 群发 病 率 得 到 共 病 组 合 。 

各 方法 所 得 结果 的 差异 性 可 以 解释 。 例 如 关联 规则 
所 得 的 两 病 组 合 : 高 血压 与 关节 炎 或 风湿 病 ， 观 察 发 病 
率 最 高 ， 但 系统 聚 类 、 被 访 者 k-medoids 聚 类 、 主 成 分 
分 析 中 均 未 被 分 为 一 类 。 这 是 由 于 高 血压 与 关节 炎 或 风 
湿 病 在 病因 学 关系 上 独立 ， 仅 是 随机 共存 的 概率 较 高 。 
关联 规则 中 以 高 血压 为 后 项 集 得 到 的 另外 几 个 两 病 组 合 
( 血脂 异常 与 高 血压 、 心 脏 病 与 高 血压 、 糖 尿 病 或 血 
糖 升 高 与 高 血压 ) ， 发 病 率 与 期 望 发 病 率 的 比值 >1， 
病因 学 关系 上 并 不 独立 ， 致 病因 素 相 关 ， 在 其 他 几 种 方 
法 中 也 被 分 为 一 类 。 骨 部 疾病 或 消化 系统 疾病 、 关 节 炎 
或 风湿 病 这 一 共 病 组 合 ， 发 病 率 与 期 望 发 病 率 的 比值 
>1， 这 一 共 病 组 合 在 其 他 方法 中 也 出 现 。 关 联 规则 方法 
简单 直接 但 单纯 关注 发 病 率 会 忽略 一 些 关联 紧密 但 发 病 
率 较 低 的 共 病 模式 。 例 如 慢性 肺 部 疾患 如 慢性 支气管 炎 
或 肺 气 肿 、 肺 心病 与 哮喘 ， 由 于 哮 哈 的 发 病 率 较 低 ， 共 
病 率 在 人 群 中 不 高 ,但 是 其 他 几 种 方法 均 能 体现 此 组 合 。 
3.2 本 研究 与 同类 研究 的 差异 及 一 致 性 本 研究 结论 
与 国内 同类 研究 有 差异 也 有 一 致 。 刘 贝 贝 等 中 研究 选 
取 了 同样 的 数据 及 方法 ,但 删除 了 数据 缺失 的 被 访 者 ， 
年 龄 的 选取 范围 为 45 岁 以 上 ， 得 到 发 病 率 明 显 较 低 。 
本 研究 保留 缺失 数据 ， 得 到 结论 更 接近 CHARLS 被 访 
者 总 体 及 国内 60 岁 及 以 上 人 和 群 特征 。 数 据 差异 但 结论 
一 致 ， 与 高 血压 组 合 的 疾病 较 多 ， 血 管 循环 系统 两 病 组 
合 提升 度 较 高 。 歼 艳 娜 等 '" 的 研究 也 采用 了 2018 年 
的 CHARLS 数据 (数据 版 本 不 同 ， 导 致 数据 量 有 轻微 
差别 ) ， 通 过 共 现 网 络 图 得 到 了 两 病 及 三 病 组 合 ， 本 人 研 
究 数据 及 结论 与 其 一 致 。 孙 至 佳 等 “1 的 研究 基于 中 国 
慢 病 前 脆性 研究 ( China Kadoorie Biobank，CKB ) 数据 ， 


以 Yule's Q 距离 进行 系统 聚 类 ， 得 到 基线 调查 数据 中 ， 
糖尿 病 、 冠 心病 、 中 风 及 高 血压 聚 为 一 类 的 结论 ， 本 研 
究 结果 与 之 一 致 。 但 是 第 二 次 重复 调查 中 ， 结 论 有 所 区 
别 ， 本 研究 恶性 肿瘤 与 其 他 慢 病 的 关系 也 与 其 不 同 。 

同类 研究 结果 的 不 一 致 在 于 疾病 有 所 不 同 ， 也 由 于 
调查 人 员 与 被 访 者 的 认 知 及 对 疾病 的 理解 不 同 ， 访 谈 数 
据 存 在 一 定 的 误差 。 本 研究 中 多 个 方法 均 显 示 亚 性 肿瘤 
与 其 他 疾病 并 没有 明显 的 共 病 特性 ， 而 孙 至 佳 等 '" 的 
研究 中 恶性 肿瘤 与 其 他 疾病 的 关联 更 紧密 ， 这 个 差异 可 
能 是 由 于 恶性 肿瘤 的 定义 不 同 以 及 被 访 者 人 和 群 不 同 。 
3.3 本 研究 的 独特 与 不 足 ”本 研究 的 独特 之 处 在 于 数 
据 总 量 在 国内 同类 研究 中 相对 较 大 ， 使 用 一 系列 方法 进 
行 多 病 分 类 ， 并 尝试 新 算法 。 除 了 系统 聚 类 采用 谱系 图 
与 临床 结合 的 方法 判别 分 类 个 数 ， 被 访 者 k-medoids 聚 
类 采用 了 体现 数据 特性 的 方法 进行 个 数 判 断 ， 主 成 分 分 
析 采 用 碎 石 图 确定 个 数 ，LCA 采用 遍 指标 法 历法 选择 分 
类 数 , 减少 了 主观 判断 。 国 内 共 病 模式 相关 分 析 方 法 少 ， 
以 慢 病 距离 算法 为 例 ， 国 外 多 采用 Jaccard 以 及 Yule's 
Q 距离 ， 国 内 较 少 采用 。 后 两 种 算法 更 能 体现 01 数据 
包含 的 信息 。 

本 研究 尝试 通过 对 比 结果 来 说 明 方法 的 适用 性 ， 得 
到 的 一 致 共 病 组 合 病因 关联 明显 。 主 成 分 和 系统 聚 类 对 
慢 病 分 类 ， 而 k-medoids 及 LCA 对 人 和 群 分 类 ， 可 以 进 一 
步 天 联 患 者 特征 深入 分 析 。 聚 类 分 析 依 赖 于 距离 的 计算 
方法 ， 而 潜在 类 分 析 用 的 潜 变 量 来 解释 外 显 指标 之 间 的 
关联 ， 被 潜 变 量 解 释 后 的 外 显 指 标 间 实 现 局 部 独立 性 ， 
更 加 客观 ， 保 证 了 多 病 模式 分 类 的 稳定 性 。 多 病 研 究 需 
要 根据 研究 目的 进行 选择 模式 分 析 方 法 ， 或 者 使 用 多 种 
方法 得 到 具有 一 致 性 的 稳定 分 类 。 

本 研究 的 不 足 之 处 在 于 为 了 保证 数据 客观 性 及 样本 
数量 ， 通 过 众 数 填充 多 病 缺 失 数据 ， 会 影响 发 病 率 的 准 
确 度 ， 导 致 发 病 率 低 于 总 体 。 保 留 了 缺失 的 被 访 者 人 口 
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特征 学 数据 并 没有 进行 处 理 ， 虽 然 分 类 到 被 访 者 个 人 ， 
但 未 结合 人 群 的 各 种 特征 进一步 研究 ， 未 分 析 和 危险 因素 
及 预后 ， 内 容 不 够 贴近 临床 。 
作者 贡献 : 王 留 义 提 出 研究 选 题 方向 和 总 体 研 究 目 
标 ， 对 研究 进行 可 行 性 分 析 ， 对 文章 整体 负责 ， 监 督 管 
理 ; 潘 轮 负责 数据 清洗 、 处 理 和 统计 学 分 析 、R 语言 纺 
程 、 绘 制图 表 ; 潘 昱 、 刘 志 辉 、 胡 倩 倩 负责 结果 分 析 与 
解释 ， 撰写 论文 初稿 活 蜂 、 刘 志 辉 负责 论文 的 修订 。 
本 文 无 利益 冲突 。 
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